Data engineer

déposez gratuitement
vos annonces et vos événements

signalez une erreur

informations générales

  • Alpes-Maritimes

CENTRE ANTOINE LACASSAGNE

CDI

Les missions qui vous attendent
Au sein du Département d'Epidemiologie, de Biostatistique et des Données de Santé, en tant que Data engineer, vous aurez la responsabilité de créer les pipelines de flux de données (structurées et non structurées) vers l'entrepot de données de santé en construction au Centre Antoine Lacassagne. Vous aurez d'étroites relations avec les équipes de data management, data science et informatique (infrastructure, sécurité et opérationnelle).
Vos principaux objectifs sont de développer, maintenir et améliorer les solutions et infrastructures data nécessaires à la collecte, la centralisation, le stockage et l'accès aux données de santé collectées au sein du Centre Antoine Lacassagne (CAL).
Vous travaillerez majoritairement sur des données de santé de vie réelle. Ces données sont générées à l'occasion des soins réalisés en routine pour un patient au sein du CAL. Ces données peuvent provenir de multiples sources : dossier patient informatisé (DPI), logiciels de prise en charge (pharmacie, imagerie, anatomopathologie, oncopharmacologie, chirurgie, oncologie), informations utilisées pour le remboursement de soins, collecte spécifique permettant de créer des registres ou des cohortes ou des Entrepôts de Données de Santé (EDS), réseaux sociaux, objets connectés, etc.

Missions principales :
-Concevoir efficacement et maintenir des flux d'intégration (collecte, Ingestion, Stockage) permettant de centraliser les données issues de plusieurs sources dans un entrepôt de données de santé tout en garantissant une qualité de données.
-Mettre en place des pipelines de données sécurisées qui seront traitées et nettoyées par les data managers pour délivrer des bases « gelées » mises à disposition des experts scientifiques, biostatisticiens et data scientists.
-Concevoir et mettre en œuvre un process et un data pipeline permettant de valider la qualité des données intégrées automatiquement dans l'Entrepôt de données de Santé, par confrontation avec les données intégrées à partir de collecte manuelle.
-Assister les data scientists spécialistes de la structuration de données non structurées issues de compte-rendu médicaux ou fiche RCP (Réunion de Concertation Pluridisciplinaire) ou documents du DPI, avec des solutions de type Natural Language Processing (NLP).
-Rédiger et mettre à disposition la documentation (guide de procédure, documents utilisateurs, référentiels, .) et participer au dépôt du dossier de l'EDS
-Communication/collaboration avec les pilotes des différents projets : reporting auprès des managers hiérarchiques et de la direction
Quel est le profil idéal ?
-Connaissances de SQL, Python (Pandas, Numpy, .), PL/SQL (option)
-Bases relationnelles
-Connaissances des données médicales
-Bonne compréhension du cycle de vie de la donnée et de la data privacy
-Capacité à réconcilier de nombreuses sources de données hétérogènes
-Notions en FHIR serait un plus
-Notions en OMOP serait un plus
-Notions en OSIRIS RWD serait un plus

Débutant (moins de 2 ans), Expérimenté (2 à 5 ans), Confirmé (5 ans et plus)

Diplôme d'ingénieur Date engineer/data/informatique ou équivalent (Bac+5 minimum)
En savoir plus sur cette annonce sur le site de notre partenaire

posté par

logo

annonces à proximité